查看原文
其他

excel技能放大招:一招解决数据分析的匹配问题(一)

徐春花 百迈客基因 2019-12-13


随着测序仪器及平台的更新换代,大数据获取的成本越来越低,途径越来越便捷,但是给我们带来的数据处理上的挑战也越来越大,尤其是大样本数据、多组学数据产生后,数据在核查及二次分析的难度也不是一般人可以驾驭的,在这里小编给您推荐一个excel升级技能,学会它(明星函数“Vlookup”),可以一次性解决您全部的数据匹配问题,相当于可以解决您三分之一的数据处理问题。


我们先来看看都能解决哪些问题,是不是您关心的问题:

1、需要的数据不在同一个excel表或同一个excel表不同sheet中,数据太多,一一拷贝太麻烦,如何整合呢?

如:基因ID、表达量数据、数据库注释信息等


2、基因数据太多,核查不同组合中的相同基因,查找起来工作量太大?

如:韦恩图可以解决组间的重合数据,但是要获得详细列表,则需要自己动 手操作了。(补充:百迈客云平台的韦恩图提供交互式基因ID信息提取,有云账号的客户有福了。没有账号也没关系,直接登录注册即可实现:https://console.biocloud.net/external/login/toLogin)。


3、不同组学中的数据整合复杂,数据量处理起来繁琐;

     

........................


说起excel表,是不是既熟悉又陌生呢?因为虽然你常用,但是其中的强大功能你了解吗?接下来让小编来给大家演示一下强大的“Vlookup”函数吧。




第一步:基本语法及操作

“Vlookup”:查找函数,用于在表格或数值数组的首列查找指定的数值,并由此返回表格或数组当前行中指定列处的数值,该函数的语法规则如下:

=VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)


参数 简单说明 输入数据类型

lookup_value  

要查找的值      数值、引用或文本字符串

table_array 要查找的区域   数据表区域

col_index_num

返回数据在查找区域的第几列数   正整数

range_lookup  

模糊匹配/精确匹配 TRUE(或不填)/FALSE


具体操作请参考视频:


1:

https://v.qq.com/txp/iframe/player.html?vid=t1334m3flab&width=500&height=375&auto=0


需要注意的是,输入数字0,表示FALSE,即精确匹配,数字1表示TURE,近似匹配。


“vlookup”函数要求的比对条件必须是完全一致的,如果中间出现基因ID名称不一致的情况,则不会匹配到相应的信息,这是则需要使用“近似匹配”。


2:


https://v.qq.com/txp/iframe/player.html?vid=u1334a72pyh&width=500&height=375&auto=0


但是为了能够保证数据的完全匹配性,最稳妥的做法还是先把基因ID匹配成统一格式之后,再进行数据的检索。


     基因ID如何匹配成统一格式......?


     不同差异组合如何筛选共同基因......?


视频呢?视频呢?

小编很抱歉。。


       因为视频数目的限制,小编只好将剩余视频内容整理放在了后台, 如果你感兴趣,请在公众号后台回复【excel】,为你推送剩余内容。。


......回复【excel】精彩继续......


  


这里包罗万象


学到知识、get技能


展示自我,share经验


交锋、碰撞、辩论与思考同在


只有不断学习,突破自我,才能不被时代碾压

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存